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(54) Title: METHOD OF IDENTIFYING CYTOSINE METHYLATION PATTERNS IN GENOMIC DNA SAMPLES 

(54) Bezeichnung: VERFAHREN ZUR IDENTIFIKATION VON CYTOSIN-METHYLIERUNGSMUSTERN IN GENOMISCHEN 

DNA-PROBEN 

(57) Abstract 

The invention relates to a method of identifying cytosine methylation patterns in genomic DNA samples. The inventive method 
comprises the following steps: a) chemically treating a genomic DNA sample in such a manner that the cytosine and the 5-methyI cytosine 
react differently and that the two products have a different base-pairing behavior in the duplex; b) enzymatically amplifying parts of the 
DNA sample treated in this manner, c) binding the amplified parts of the DNA sample treated in this manner to a surface- d) hybridizing a 
set of probes of different nucleic base sequences to the immobilized DNA samples, said respective base sequences containing at least once 
the dinucleot.de sequence 5'-CpG~3'; e) removing the non-hybridized probes; 0 analyzing the hybridized probes in a mass spectrometer 
the position of the probes on the sample carrier allowing an allocation of the DNA sample to be hybridized; g) converting the peak-patterns' 
obtained from the mass-specters to methylation patterns and matching the new data with a data library. 

(57) Zusammenfassung 

Die Erfindung betrifft ein Verfahren zur Identifikation von Cytosin-Methylierungsmustern in genomischen DNA-Proben wobei 
man a) eine genom.sche DNA-Probe chemisch derart behandelt, daB Cytosin und 5-Methylcytosin unterschiedlich reagieren und man in 
der Duplex em unterschiedliches Basenpaarungsverhalten der beiden Produkte erhalt; b) Teile der so behandelten DNA-Probe enzymatisch 
amp ,fiz.ert; c) d.e amphfizierten Telle der so behandelten DNA-Probe an eine Oberflache bindet; d) einen Satz von Sonden unterschiedlicher 
Nukleobasensequenzen die jeweils mindestens einmal die Dinukleotidsequenz 5'-CpG-3' enthalten, an die immobilisierten DNA-Proben 
hybndisiert; e) die nicht hybndis.erten Sonden abmmnt; f) die hybridisierten Sonden in einem Massenspektrometer analysiert, wobei die 
Position der Sonden auf dem Probentrager eine Zuordnung zu der hybridisierenden DNA-Probe eriaubt; g) Obertragung der aus den 
Massenspektren erhaltenen Peakmuster in Methylierungsmuster und Abgleich der neuen Daten mit einer Datenbank 
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Verfahren zur Identif ikation von Cytosin- 
Methylierungsmustern in genomischen DNA-Proben 

Die Erfindung betrifft ein Verfahren zur Identif ikation 

von Cytosin-Methylierungsmustern in genomischen DNA- 
Proben . 

Die genetische Information, die durch vollstandige Se- 
quenzierung genomischer DNA als Basenabfolge erhalten 
wird, beschreibt das Genom einer Zelle nur unvollstandig. 
5-Methylcytosin-Nukleobasen, die durch reversible Methy- 
lierung von DNA in der Zelle entstehen, sind ein epigene- 
tischer Informationstrager und dienen beispielsweise zur 
Regulation von Promotoren. Der Methylierungszustand eines 
Genoms reprasentiert den gegenwartigen Status der Genex- 
pression, ahnlich wie ein mRNA Expressionsmuster . 

5-Methylcytosin ist die haufigste kovalent modifizierte 
Base in der DNA eukaryotischer Zellen. Sie spielt bei- 
spielsweise eine Rolle in der Regulation der Transkripti- 
on, genomischem Imprinting und in der Tumorgenese. Die 
Identifizierung von 5-Methylcytosin als Bestandteil gene- 
tischer Information ist daher von erheblichem Interesse. 
5-Methylcytosin-Positionen konnen jedoch nicht durch Se- 
quenzierung identif iziert werden, da 5-Methylcytosin das 
gleiche Basenpaarungsverhalten aufweist wie Cytosin. Dar- 
uberhinaus geht bei einer PCR-Amplif ikation die epigene- 
tische Information, die die 5-Methylcytosine tragen, 
vollstandig verloren. 

Es sind mehrere Verfahren bekannt, die diese Probleme zu 
losen versuchen. Meist wird eine chemische Reaktion oder 
enzymatische Behandlung der genomischen DNA durchgefuhrt, 
in deren Folge sich die Cytosin- von den Methylcytosin- 
Basen unterscheiden lassen. Eine gangige Methode ist die 
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Umsetzung von genomischer DNA mit Bisulfit, die nach al- 
kalischer Hydrolyse in zwei Schritten zu einer Umwandlung 
der Cytosin Basen in Uracil ftlhrt (Shapiro, R. , Cohen, 
B. f Servis, R. Nature 227, 1047 (1970). 5-Methylcytosin 
bleibt unter diesen Bedingungen unverandert. Die Umwand- 
lung von C in U fuhrt zu einer Veranderung der Basense- 
quenz, aus der sich durch Sequenzierung nun die ursprung- 
lichen 5-Methylcytosine ermitteln lassen (nur diese lie- 
fern noch eine Bande in der C-Spur) . 

Eine Obersicht liber weitere bekannte Moglichkeiten, 5- 
Methylcytosine nachzuweisen, ist beispielsweise dem fol- 
genden Ubersichtsartikel zu entnehmen: Rein, T., DePam- 
philis, M. L., Zorbas, H., Nucleic Acids Res. 26, 2255 
(1998). 

Die Bisulphit-Technik wird bisher bis auf wenige Ausnah- 
men (z.B. Zeschnigk, M. et al., Eur. J. Hum. Gen. 5, 94- 
98; Kubota T. et al., Nat. Genet. 16, 16-17) nur in -der 
Forschung angewendet. Immer aber werden kurze, spezifi- 
sche Stucke eines bekannten Gens nach einer Bisulphit- 
Behandlung amplifiziert und entweder komplett sequenziert 
(Olek, A. and Walter, J., Nat. Genet. 17, 275-276) oder 
einzelne Cytosin-Positionen durch eine „Primer-Extension- 
Reaktion" (Gonzalgo, M. L. and Jones, P. A., Nucl. Acids. 
Res. 25, 2529-2531) oder Enzymschnitt (Xiong, Z. and 
Laird, P.W., Nucl. Acids. Res. 25, 2532-2534) nachgewie- 
sen. Alle diese Referenzen stammen aus dem Jahre 1997. 
Das Konzept, komplexe Methylierungsmuster zur Korrelation 
mit phanotypischen Daten komplexer genetischer Erkrankun- 
gen zu verwenden, ist lediglich in DE-19543065 Al er- 
wahnt. So wird hierin zum Beispiel die eigentliche Detek- 
tion nicht uber die Analyse der Hybrisierung von Nuklein- 
saure-Sonden im Massenspektrometer durchgef uhrt . 
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Nicht immer ist es erf orderlich, tatsachlich die gesamte 
Sequenz eines Gens oder Genabschnitts zu ermitteln, wie 
dies bei einer Sequenzierung das Ziel ist. Dies ist ins- 
besondere dann der Fall, wenn wenige 5-Methylcytosin- 
5 Positionen innerhalb einer langeren Basensequenz fur eine 
Vielzahl von unterschiedlichen Proben abzutasten sind. 
Die Sequenzierung liefert hier in groftem Umfang redundan- 
te Information und ist zudem sehr teuer. Dies ist auch 
schon dann der Fall, wenn die Sequenz bereits «bekannt ist 

10 und ausschlieftlich Methylierungspositionen dargestellt 

werden sollen. Auch ist es denkbar, daft in einigen Fallen 
uberhaupt nur die Unterschiede im Methylierungsmuster 
zwischen verschiedenen genomischen DNA-Proben von Inter- 
esse sind und daft auf die Ermittlung einer Vielzahl iiber- 

15 einstimmender methylierter Positionen verzichtet werden 
kann. Fur die hier angefuhrten Fragestellungen existiert 
bislang kein Verfahren, das ohne Sequenzierung jeder ein- 
zelnen Probe, kostengunstig die gewunschten Ergebnisse 
liefert. 

20 

Sequenzinformation muft auch umso mehr immer weniger neu 
ermittelt werden, da die Genomprojekte, deren Ziel die 
vollstandige Sequenz verschiedener Organismen ist, zugig 
voranschreiten. Vom menschlichen Genom sind zwar derzeit 
25 erst etwa 5 % fertig sequenziert, jedoch kommen jetzt, 
weil andere Genomprojekte dem Ende zuneigen und dadurch 
Sequenzierressourcen frei werden, jedes Jahr weitere 5 % 
dazu. Mit der Vervollstandigung der Sequenzierung des 
menschlichen Genoms wird bis zum Jahre 2006 gerechnet. 

30 

Matrix-assistierte Laser Desorptions/Ionisations Massen- 
spektrometrie (MALDI) ist eine neue, sehr leistungsfahige 
Entwicklung fur die Analyse von Biomolekulen (Karas, M. 
and Hillenkamp, F. 1988. Laser desorption ionization of 
35 proteins with molecular masses exceeding 10.000 daltons. 

Anal. Chem. 60: 2299-2301). Ein Analytmolekul wird in ei- 
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ne im UV absorbierende Matrix eingebettet. Durch einen 
kurzen Laserpuls wird die Matrix ins Vakuum verdampft und 
oas Analyt so unf ragmentiert in die Gasphase befordert. 
Eine angelegte Spannung beschleunigt die Ionen in ein 
5 feldfreies Flugrohr. Auf Grund ihrer verschiedenen Massen 
werden Ionen unterschiedlich stark beschleunigt. Kleinere 
Ionen erreichen den Detektor fruher als groliere. Die 
Flugzeit wird in di.e Masse der Ionen umgerechnet . 

10 Technische Neuerungen der Hardware haben die Methode si- 
gnifikant verbessert. Erwahnenswert ist hierbei die 
„delayed extraction" -Methode (DE) . Fur DE wird die Be- 
schleunigungsspannung mit einer Verzogerung zum Laserpuls 
eingeschaltet und dadurch eine verbesserte Auflosung der 

15 Signale erreicht, weil die Zahl der StoBe verringert 
wird. 

MALDI eignet sich ausgezeichnet zur Analyse von Peptiden 
und Proteinen. Fur Nukleinsauren ist die Empf indlichkeit 
etwa 100-mal schlechter als fur Peptide und nimmt mit zu- 
nehmender Fragmentgrofie iiberproportional ab. Der Grund 
dafur liegt darin, daB far die Ionisation von Peptiden 
und Proteinen lediglich ein einziges Proton eingefangen 
werden muli. Fiir Nukleinsauren, die ein vielfach negativ 
25 geladenes Ruckgrat haben, ist der Ionisationsprozeli durch 
die Matrix wesentlich inef f izienter . Fiir MALDI spielt die 
Wahl der Matrix eine eminent wichtige Rolle. Fur die 
Desorption von Peptiden sind einige sehr leistungsf ahige 
Matrices gefunden worden, die eine sehr feine Kristalli- 
sation ergeben. Fur DNA sind zwar inzwischen einige ge- 
eignete Matrices gefunden worden, jedoch wurde dadurch 
der Empfindlichkeitsunterschied nicht verringert. Phos- 
phorothioatnukleinsauren, bei denen die gewohnlichen 
Phosphate des Riickgrats durch Thiophosphate substituiert 
35 sind, lassen sich durch einfache Alkylierungschemie in 
eine ladungsneutrale DNA umwandeln. 
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Die Kopplung eines "charge tags" an diese modif izierte 
DNA resultiert in der Steigerung der Empf indlichkeit in 
den gleichen Bereich wie er fur Peptide gefunden wird. 
Durch diese Modif ikationen hat sich auch die Mbglichkeit 
eroffnet, ahnliche Matrices, wie sie fur die Desorption 
von Peptiden verwendet werden, zu nutzen. Ein weiterer 
Vorteil von charge tagging ist die erhohte Stabilitat der 
Analyse gegen Verunreinigungen, die den Nachweis unraodi- 
fizierter Substrate stark erschweren. PNAs und Methyl- 
phosphonatoligonukleotide sind mit MALDI untersucht wor- 
den und lassen sich so analysieren. 

Derzeit ist diese Technologie in der Lage, im Massenbe- 
15 reich von 1.000 bis 4.000 Da, Molekule mit einer .Massen- 
differenz von 1 Da zu unterscheiden . Durch die naturliche 
Verteilung von Isotopen sind die meisten Biomolekule je- 
doch schon etwa 5 Da breit. Technisch ist diese massen- 
spektrometrische Methode also vorzuglich fur die Analyse 
20 von Biomolekulen geeignet. Verniinf tigerweise mussen zu 

analysierende Produkte, die unterschieden werden sollen, 
also mindestens 5 Da auseinander liegen. In diesem Mas- 
senbereich konnten also 600 Molekule unterschieden wer- 
den . 
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Ein Array mit vielen tausend Ziel-DNAs kann auf einer 
Festphase immobilisiert und anschlieftend k6nnen alle 
Ziel-DNAs gemeinsam auf das Vorhandensein einer Sequenz 
mittels einer Sonde (Nukleinsaure mit komplementarer Se- 
quenz) untersucht werden. 



Eine Obereinstimmung in der Ziel-DNA mit der Sonde kommt 
durch eine Hybridisation der zwei Teile miteinander zu- 
stande. Sonden konnen beliebige Nukleinsauresequenzen von 
35 beliebiger Lange sein. Es existieren verschiedene Verfah- 



WO 00/44934 PCT/DE00/00288 



10 



15 



30 



ren fur die Auswahl von optimalen Bibliotheken von Son- 
densequenzen, welche minimal miteinander uberlappen. 
jundensequenzen konnen auch gezielt zusammengestellt wer- 
den, um bestimmte Ziel-DNA Sequenzen aufzufinden. Oligo- 
f ingerprinting ist ein Ansatz, bei welchem diese Techno- 
logie zum Einsatz kommt . Eine Bibliothek von Ziel-DNAs 
wird mit kurzen Nukleinsauresonden abgetastet. Meist sind 
hier die Sonden nur 8-12.Basen lang. Es wird jeweils eine 
Sonde auf einmal an eine auf einer Nylonmembran immobili- 
sierte Ziel-DNA-Bibliothek hybridisiert . Die Sonde ist 
radioaktiv markiert und die Hybridisierung wird anhand 
der Lokalisierung der Radioaktivitat beurteilt. Fur die 
Abtastung eines immobilisierten DNA-Arrays sind auch 
schon fluoreszent markierte Sonden verwendet worden. 



US 5, 605, 798 beschreibt die Abtastung von iiber Hybridi- 
sierung immobilisierten Ziel-Nukleinsauren mit Nuklein- 
sauresonden und Massenspektrometrie. Hierbei wird jedoch 
weder gezielt eine Identif ikation von Methylierungsmu- 
20 stern durchgef iihrt, noch werden raodif izierte Nukleinsau- 
ren (z. B. PNAs, Charge Tags) eingesetzt, noch wird eine 
Genomamplif ikation durchgef uhrt . 

Als Sonden kommen jegliche Molekule in Frage, die se- 
25 quenzspezifisch mit einer Ziel-DNA wechselwirken konnen. 
Am gangigsten sind Oligodeoxyribonukleotide . Jedoch bie- 
tet sich jede Modif ikation von Nukleinsauren an, z.B. 
Peptide Nucleic Acids (PNA) , Phosphorothioatoligonukleo- 
tide Oder Methylphosphonatoligonukleotide . Die Spezifitat 
einer Sonde ist sehr wesentlich. Phosphorothioatoligonu- 
kleotide sind nicht allzugut geeignet, da ihre Struktur 
durch die Schwefelatome und dadurch die Hybridisie- 
rungseigenschaft gestort ist. Ein Grund hierfur konnte 
sein, daft Phosphorothioatoligonukleotide normalerweise 
35 nicht diastereomerenrein synthetisiert werden. Bei Me- 

thylphosphonatoligonukleotiden besteht ein ahnliches Pro- 
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blem, jedoch werden diese Oligonukleotide vermehrt dia- 
stereomerenrein synthetisiert . Ein wesentlicher Unter- 
schied dieser Modifikation ist das ungeladene Ruckgrat, 
welches zu einer verrainderten Abhangigkeit der Hybridisa- 
tion von Puffersalzen und insgesamt durch die geringere 
Abstoftung zu hoherer Affinitat fflhrt. Peptide Nucleic 
Acids haben ebenfalls ein ungeladenes Ruckgrat, welches 
gleichzeitig chemisch sehr stark von der gangigen Zucker- 
Phosphat Struktur des Ruckgrats in Nukleinsauren ab- 
weicht. Das Ruckgrat einer PNA hat eine Amidsequenz an- 
stelle des Zucker-Phosphat Ruckgrats gewohnlicher DNA. 
PNA hybridisiert sehr gut mit DNA komplementarer Sequenz. 
Die Schmelztemperatur eines PNA/DNA-Hybrids ist hoher als 
die des entsprechenden DNA/ DNA-Hybr ids und wiederum ist 
15 die Abhangigkeit der Hybridisierung von Puffersalzen re- 
lativ gering. 

Kombinatorische Synthesen, d.h. die Herstellung von Sub- 
stanzbibliotheken ausgehend von einem Gemisch von Vorstu- 
fen, werden sowohl auf fester als auch in flussiger Phase 
durchgefiihrt. Vor allem die kombinatorische Festphasen- 
synthese hat sich friihzeitig etabliert, da in diesem Fall 
die Abtrennung von Nebenprodukten besonders einfach ist. 
Nur die an den Support gebundenen Zielverbindungen werden 
25 in einem Waschschritt zuruckbehalten und am Ende der Syn- 
these durch das gezielte Spalten eines Linkers isoliert. 
Diese Technik erlaubt auf einfachem Wege die gleichzeiti- 
ge Synthese einer Vielzahl verschiedener Verbindungen an 
einer Festphase und somit den Erhalt von chemisch 
30 "reinen" Substanzbibliotheken. 

Daher sind die Verbindungsklassen, die auch in nicht kom- 

i 

binatorischen, konventionellen Synthesen auf einer Fest- 
phase synthetisiert werden, der kombinatorischen Chemie 
35 besonders leicht zuganglich und werden demzufolge auch 
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breit verwendet. Dies trifft vor allem auf Peptid-, Nu- 
kleinsaure- und PNA-Bibliotheken zu. 

Die Synthese von Peptiden erfolgt durch Binden der ersten 
N-geschutzten Aminosaure (z.B. Boc) an den Support, nach- 
folgende Entschutzung und Reaktion der zweiten Aminosaure 
mit der f reigewordenen NH2-Gruppe der ersten. Nicht rea- 
gierte Aminofunktionen werden in einem weiteren "Capping" 
Schritt einer Weiterreaktion im nachsten Synthesezyklus 
entzogen. Die Schutzgruppe an der Aminof unktion der zwei- 
ten Aminosaure wird entfernt und der nachste Baustein 
kann gekoppelt werden. Zur Synthese von Peptidbibliothe- 
ken wird ein Gemisch von Aminosauren in einem oder mehre- 
ren Schritten verwendet. Die Synthese von PNA und PNA- 
Bibliotheken erfolgt sinngemafi. 

Nukleinsaure-Bibliotheken werden meist durch Festphasen- 
synthese mit Gemischen verschiedener Phosphoramidit- 
Nukleoside erhalten. Dies kann auf kommerziell erhaltli- 
chen DNA-Synthesizern ohne Veranderungen in den Synthese- 
protokollen durchgefuhrt werden. 

Verschiedene Arbeiten zur kombinatorischen Synthese von 
PNA Bibliotheken sind publiziert worden. Diese Arbeiten 
behandeln den Aufbau von kombinatorischen Sequenzen, d.h. 
die Synthese von PNAs in denen einzelne, spezifische Ba- 
sen in der Sequenz durch degenerierte Basen ersetzt wer- 
den und dadurch zufallige Sequenzvarianz erreicht wird. 

Die Verwendung massenspektrometrischer Methoden fur die 
Analyse kombinatorischer Bibliotheken ist mehrfach be- 
schrieben worden. 

Es existieren verschiedene Verfahren um DNA zu immobili- 
sieren. Das bekannteste Verfahren ist die Festbindung ei- 
ner DNA, welche mit Biotin f unktionalisiert ist, an eine 
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Streptavidin-beschichtete Oberflache. Die Bindungsstarke 
dieses Systems entspricht einer kovalenten chemischen 
Bindung ohne eine zu sein. Urn eine Ziel-DNA kovalent an 
eine chemisch vorbereitete Oberflache binden zu konnen, 
bedarf es einer entsprechenden Funktionalitat der Ziel- 
DNA. DNA selbst besitzt keine Funktionalisierung, die ge- 
eignet ist. Es gibt verschiedene Varianten in eine Ziel- 
DNA eine geeignete Funktionalisierung einzufuhren: Zwei 
leicht zu handhabende Funktionalisierungen sind primare, 
aliphatische Amine und Thiole. Solche Amine werden quan- 
titativ mit N-Hydroxy-succinimidestern umgesetzt und 
Thiole reagieren unter geeigneten Bedingungen quantitativ 
mit Alkyliodiden. Eine Schwierigkeit besteht im Einfuhren 
einer solchen Funktionalisierung in eine DNA. Die ein- 
15 fachste Variante ist die Einfuhrung durch einen Primer 
einer PCR. Gezeigte Varianten benutzen 5' -modif izierte 
Primer (NH2 und SH) und einen bifunktionalen Linker. 
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Ein wesentlicher Bestandteil der Immobilisierung auf ei- 
ner Oberflache ist ihre Beschaf f enheit . Bis jetzt be- 
schriebene Systeme sind hauptsachlich aus Silizium oder 
Metall (magnetic beads). Eine weitere Methode zur Bindung 
einer Ziel-DNA basiert darauf, eine kurze Erkennungsse- 
quenz (z.B. 20 Basen) in der Ziel-DNA zur Hybridisierung 
25 an ein oberf lachenimmobilisiertes Oligonukleotid zu ver- 
wenden. 



Es sind auch enzymatische Varianten zur Einfuhrung von 
chemisch aktivierten Positionen in eine Ziel-DNA be- 
schrieben worden. Hier wird an einer Ziel-DNA enzymatisch 
eine 5' -NH2-Funktionalisierung durchgefuhrt . 
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Aufgabe der vorliegenden Erfindung ist es, ein Verfahren 
zu schaffen, welche die Nachteile des Standes der Technik 
35 uberwindet und in der Lage ist, effektiv und hochparalle- 



WO 00/44934 PCT/DE00/00288 

10 

lisiert Cytosin-Methylierungen in einem Array von immobi- 
lisierten genomischen DNA-Proben aufzuzeigen. 

Gegenstand der vorliegenden Erfindung ist daher ein Ver- 
5 fahren zur Auffindung von epigenetischen Inf ormationstra- 
gern in Form von 5-Methylcytosin-Basen in genomischer 
DNA, das eine Vielzahl von Sonden gleichzeitig zur mas- 
senspektrometrischen Untersuchung eines Arrays von Ziel- 
Nukleinsauren verwendet. 

10 

Die erfindungsgemaBe Aufgabe wird gelost, in dem ein Ver- 
fahren Verfahren zur Identif ikation von Cytosin- 
Methylierungsmustern in genomischen DNA-Proben zur Verfu- 
gung gestellt wird, bei dem man: 

15 

a) eine genomische DNA-Probe chemisch derart behandelt, 
daft Cytosin und 5-Methylcytosin unterschiedlich reagieren 
und man in der Duplex ein unterschiedliches Basenpaa- 
rungsverhalten der beiden Produkte erhalt; 

20 

b) Teile der so behandelten DNA-Probe enzymatisch ampli- 
f iziert ; 

c) die amplifizierten Teile der so behandelten DNA-Probe 
25 an eine Oberflache bindet; 

d) einen Satz von Sonden unterschiedlicher Nukleobasense- 
quenzen, die jeweils mindestens einmal die Dinukleotidse- 
quenz 5 f -CpG-3' enthalten, an die immobilisierten DNA- 

30 Proben hybridisiert ; 

e) die nicht hybridisierten Sonden abtrennt; 

f) die hybridisierten Sonden in einem Massenspektrometer 
35 analysiert, wobei die Position der Sonden auf dem Proben- 

trager eine Zuordnung zu der hybridisierenden DNA-Probe 
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erlaubt; 

g) Ubertragung der aus den Massenspektren erhaltenen Pe- 
akmuster in Methylierungsmuster und Abgleich der neuen 
5 Daten mit einer Datenbank. 

Erfindungsgemaft bevorzugt ist es, daft man in c) ein oder 
mehrere amplif izierte genomische DNA-Fragmente durch Hy- 
bridisierung mit komplementaren Oligonukleotid- oder PNA- 
Sequenzen, die kovalent an die Oberflache gebunden sind, 
immobilisiert . 



10 



15 



Erfindungsgemaft bevorzugt ist es ferner, daft nach der Hy- 
bridisierung ein Cross-Linking der genomischen DNA- 
Fragmente mit den an der Oberflache gebundenen Oligonu- 
kleotid- oder PNA-Sequenzen erfolgt. Besonders bevorzugt 
ist hierbei, daft man zum Cross-Linking kovalente chemi- 
sche Bindungen ausbildet. Erfindungsgemaft bevorzugt ist 
hierbei ferner, daft man zum Cross-Linking elektrostati- 
20 sche Wechselwirkungen ausbildet. 

Vorteilhaft ist es ferner, daft die an die Oberflache ge- 
bundenen Oligonukleotid- oder PNA-Sequenzen 5-Bromuracil- 
Bausteine enthalten. 



25 



30 



Erfindungsgemaft bevorzugt ist es, daft die immoblisierten 
komplementaren Oligonukleotidsequenzen modifizierte Ba- 
sen, Ribose oder Ruckgrateinheiten beinhalten. 

Das erfindungsgemafte Verfahren ist ferner dadurch gekenn- 
zeichnet, daft man in b) die genomische DNA-Probe in Form 
mehrerer amplif izierter Fragmente vermehrt, so daft man 
mindestens 0,01 % des gesamten Genoms amplif iziert . 



35 



Erfindungsgemaft bevorzugt ist es auch, daft man die Mi- 
schung amplif izierter DNA-Fragmente auf eine Oberflache 
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bindet, auf der eine Vielzahl von unterschiedlichen Punk- 
ten angeordnet ist die jeweils in der Lage sind, unter- 
schiedliche Teile der amplif izierten DNA-Probe zu binden. 

Erfindungsgemaft bevorzugt ist ferner, daft man in d) einen 
Satz von Sonden verwendet, welcher die Dinukleotid- 
Sequenz 5'-CpG-3' nur einmal je Sonde enthalt und die 
Sonden ansonsten jeweils entweder keine Cytosin oder kei- 
ne Guanin Basen urafassen. 



Aufterdem ist es erf indungsgemaft bevorzugt, daft man 
Schritt a) eine Bisulfit- oder Pyrosulfit- oder Disulfit- 
losung oder eine Mischung aus den angegebenen Ldsungen, 
zusammen mit anderen Reagenzien fur die spezifische oder 
15 hinreichend selektive Umwandlung von Cytosin in Uracil 
verwendet . 

Vorteilhaft ist es auch, daft die zur Immobilisierung von 
amplifizierter Proben-DNA verwendete Oberflache zugleich 
der Probentrager fur ein Massenspektrometer ist. Bevor- 
zugt ist es dabei, daft man die zur Immobilisierung von 
amplifizierter Proben-DNA verwendete Oberflache als gan- 
zes vor f) auf einen Probentrager fur ein Massenspektro- 
meter aufbringt. Bevorzugt ist es hierbei auch, daft man 
25 die hybridisierten Sonden vor dera, nach dem oder durch 
den Kontakt mit einer Matrix von den immobilisierten 
amplif izierten DNA-Proben ablest. 



Erfindungsgemaft bevorzugt ist es ferner, daft die Sonden 
Nukleinsauren sind, die ein oder mehrere Massen-Tags tra- 
gen. Erfindungsgemaft vorteilhaft ist es auch, daft ein 
oder mehrere Massen-Tags zugleich Ladungs-Tags sind. Oder 
daft die Sonden zusatzlich ein Ladungs-Tag tragen. 



35 



Erfindungsgemaft bevorzugt ist es, daft die Sonden modifi- 
zierte Nukleinsauremolekiile sind. Hierbei ist besonders 
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bevorzugt, daft die raodif izierten Nukleinsauremolekule 
PNAs, alkylierte Phosphorothioatnukleinsauren oder Alkyl- 
phosphonatnukleinsauren sind. 

Erfindungsgemaft bevorzugt ist es, daft man die Sonden 
durch kombinatorische Synthese herstellt. Dabei ist er- 
findungsgemaft besonders bevorzugt, daft man unterschiedli- 
che Basenbausteine derart markiert, daft die aus ihnen 
synthetisierten Sonden jeweils uber ihre Massen im Mas- 
senspektrometer unterscheidbar sind. 

Erfindungsgemaft vorteilhaft ist es ferner, daft man die 
Sonden als Teilbibliotheken herstellt und diese mit un- 
terschiedlichen Massen- und/oder Ladungs-Tags versieht. 

Ganz besonders erfindungsgemaft bevorzugt ist es, daft man 
in f) matrix-assistierte Laser Desorptions/lonisations 
Massenspektrometrie (MALDI) ausfiihrt. 



Ein weiterer Gegenstand der vorliegenden Erfindung ist 
ein Kit fur die Durchf iihrung des erf indungsgemaften Ver- 
fahrens, umfassend einen Probentrager fur ein Massenspek- 
trometer, welcher derart modifiziert ist, daft beliebig 
wahlbare Teile eines Genoms an diesen immobilisiert wer- 
25 den und/oder Sondenbibliotheken, mit denen man die an den 
Probentrager immobilisierte DNA massenspektrometrisch 
analysiert und/oder weiteren Chemikalien, LSsungsmitteln 
und/oder Hilfsstoffen sowie gegebenenf alls einer Bedie- 
nungsanleitung . 



Das erfindungsgemafte Verfahren dient zur Identif ikation 
von 5-Methylcytosin-Positionen in genomischer DNA, die 
unterschiedlichsten Ursprungs sein kann. Die genomische 
DNA wird zunachst chemisch so behandelt, daft sich ein Un- 
35 terschied in der Reaktion der Cytosin-Basen zu den 5- 

Methylcytosin-Basen ergibt. Mdgliche Reagenzien sind hier 
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z. B. Disulfit (auch als Bisulfit bezeichnet) , Hydrazin 
und Permanganat. In einer bevorzugten Variante des Ver- 
fahrens wird die genomische DNA mit Disulfit in Gegenwart 
von Hydrochinon oder Hydrochinonderivaten behandelt, wo- 
bei selektiv nach anschlieftender alkalischer Hydrolyse 
die Cytosin-Basen in Uracil umgewandelt werden. 5- 
Methylcytosin bleibt unter diesen Bedingungen unveran- 
dert. Nach einem Auf reinigungsprozeft , der der Abtrennung 
des uberschussigen Disulfits dient, werden bestimmte Ab- 
schnitte der vorbehandelten genomischen DNA in einer Po- 
lymerasereaktion amplif iziert . In einer bevorzugten Vari- 
ante des Verfahrens wird hier die Polymerasekettenreakti- 
on eingesetzt. In einer besonders bevorzugten Variante 
des Verfahrens wird die Polymerasekettenreaktion so 
15 durchgefiihrt, dafi> mindestens 0.01% des gesamten Genoms in 
Form mehrerer Fragmente amplif iziert werden. 

Die amplif izierte, vorbehandelte DNA-Probe kann nun in 
mehreren Varianten des Verfahrens an eine Oberflache im- 
20 mobilisiert werden. In einer bevorzugten Variante des 

Verfahrens erfolgt die Immobilisierung an die Oberflache 
derart, daft diese zuvor mit Oligonukleotiden oder kurzen 
PNA (Peptide nucleic acids) -Sequenzen modif iziert wurde 
und damit eine Hybridisierung komplementarer Sequenzen in 
25 der DNA-Probe erfolgt. Grundsatzlich kdnnen die immobili- 
sierten Oligonukleotide sowohl an den Basen, an der 
(Desoxy)-Ribose und/oder am Ruckgrat gegeniiber herkommli- 
cher DNA modif iziert sein. Werden nun verschiedene Oligo- 
nukleotid- oder PNA-Sequenzen in Form eines Arrays an 
diese Oberflache gebunden oder auf ihr synthetisiert, so 
kann jede dieser unterschiedlichen Sequenzen unterschied- 
liche Teile der amplif izierten DNA-Fragmente binden. In 
einer besonders bevorzugten Variante des Verfahrens wird 
im Anschluii an die Hybridisierung ein Cross-Linking der 
35 beiden Strange durchgef uhrt . Die kann durch Ausbildung 
einer kovanten chemischen Bindung oder einer stabilen 
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elektrostatischen Wechselwirkung erfolgen. In einer wei- 
teren bevorzugten Variante wird ein photochemisches 
Cross-Linking uber Bromuracil-Bausteine durchgef uhrt . 

Auch ist es moglich, Fragmente der vorbehandelten genomi- 
schen DNA separat zu amplif izieren und die Produkte ein- 
zeln an unterschiedlichen Orten auf der Oberflache zu im- 
mobilisieren. In einer bevorzugten Variante des Verfah- 
rens erfolgt dies derart, daft einer der PCR-Primer eine 
zur Immobilisierung geeignete Funktion tragt, die mit ei- 
ner auf der Oberflache angebrachten Funktionalitat eine 
Bindung eingehen kann. 

Die Oberflache, an die die amplif izierten DNA-Fragmente 
gebunden werden, soil sich entweder auf den Probentrager 
eines MALDI-Massenspektrometers ubertragen lassen oder 
aber selbst dieser Probentrager sein. Die Konstruktion 
und Software des Massenspektrometers gewahrleistet dabei, 
dali der jeweils untersuchte Punkt auf dem Probentrager 
den dort ursprunglich gebundenen Proben zugeordnet werden 
kann. 



An die immobilisierten amplif izierten DNA-Fragmente wird 
nun ein Satz von Sonden hybridisiert, wobei diese Sonden 
je wenigstens einmal die Sequenz 5'-CpG-3' und ansonsten 
jeweils entweder keine Cytosin oder Guanin Basen enthal- 
ten. Die Sonden konnen Oligonukleotide, mpdifizierte Oli- 
gonucleotide oder PNAs (Peptide nucleic acids) sein. In 
einer bevorzugten Variante des Verfahren wird dieser Satz 
von Sonden in einem kombinatorischen Syntheseansatz als 
kombinatorische Bibliothek hergestellt. In einer weiteren 
bevorzugten Variante des Verfahrens sind die Sonden uber 
ihre Massen eindeutig unterscheidbar, so daft ein Riick- 
schlufl von der Masse auf die Sequenz moglich ist. Dazu 
35 konnen die Sonden mit Massentags versehen sein, die die 

Massengleichkeit unterschiedlicher Sonden verhindern. Die 
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Sonden kdnnen mit Ladungstags versehen sein, urn eine bes 
sere Darstellbarkeit im Massenspektometer zu erreichen 
and urn die Stabilitat der Analyse in Anwesenheit von Sal 
zen und Detergenzien zu erhohen. Die Massentags kdnnen 
5 zugleich Ladungstags sein. Die Sonden kdnnen auch als 

kombinatorische Teilbiblioteken hergestellt werden, die 
wiederum unterschiedliche Massen- und/oder Ladungstags 
tragen. Die Sonden kdnnen PNAs, unmodif izierte Nukeinsau- 
remolekiile oder modifizierte Nukleinsauremolekule wie 
10 Phosphothioatnukleinsauren, alkylierte Phosphorothioatnu- 
kleinsauren oder Alkylphopshonatnukleinsauren sein, unbe- 
schadet einer weiteren Modifikation durch Massen- und La- 
dungstags . 

15 Die nicht hybridisierten Sonden werden in einem oder meh- 
reren Waschschritten abgetrennt. Die hybridisierten Son- 
den bleiben dabei an ihren Positionen. 



20 



Die Oberflache wird auf dem MALDI-Probentrager befestigt 
und in das Massenspektrometer transferiert bzw. unmittel 
bar transferiert, wenn das Verfahren auf dem MALDI- 
Probentrager selbst durchgefuhrt wurde. Der Array von 
Proben wird nun auf hybridisierte Sonden hin massenspek- 
trometrisch untersucht. Die hybridisierten Sonden werden 
25 dazu in einer bevorzugten Variante des Verfahren durch 
den Kontakt rait der MALDI -Matrix dehybridisiert und in 
diese eingebettet; durch die Geschwindigkeit in der die 
Matrix aufgebracht wird erfolgt aber keine gegenseitige 
Kontamination der benachbarten Punkte. An jedem Punkt er- 
geben die hybridisierten Sonden ein Peakmuster, iiber das 
auf die Sequenzen geschlossen werden kann, an denen eine 
Hybridisierung erfolgte. Aufgrund der Vorbehandlung 
(vorzugsweise mit Bisulfit) ergeben unterschiedlich am 
Cytosin methylierte DNA-Fragmente unterschiedliche Se- 
35 quenzen. Daher sind die durch die Sonden erzeugten Peak- 
muster im Massenspektrometer charakteristische Methylie- 
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rungsmuster der jeweils untersuchten DNA-Probe. Es er- 
folgt ein Abgleich dieser Methylierungsmuster mit denen 
einer Datenbank. 
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Pa tentansp ruche 

1. Verfahren zur Identif ikation von Cytosin- 

Methylierungsmustern in genomischen DNA-Proben da- 
durch gekennzeichnet, daft man: 

a) eine genomische DNA-Probe chemisch derart behan- 
delt, daft Cytosin und 5-Methylcytosin unterschiedlich 
reagieren und man in der Duplex ein unterschiedliches 
Basenpaarungsverhalten der beiden Produkte erhalt; 

♦ 

b) Teile der so behandelten DNA-Probe enzymatisch 
amplif iziert; 

c) die amplifizierten Teile der so behandelten DNA- 
Probe an eine Oberflache bindet; 

d) einen Satz von Sonden unterschiedlicher Nukleoba- 
sensequenzen, die jeweils mindestens einmal die Dinu- 
kleotidsequenz 5'-CpG-3* enthalten, an die immobili- 
sierten DNA-Proben hybridisiert; 

e) die nicht hybridisierten Sonden abtrennt; 

f) die hybridisierten Sonden in einem Massenspektro- 
meter analysiert, wobei die Position der Sonden auf 
dem Probentrager eine Zuordnung zu der hybridisieren- 
den DNA-Probe erlaubt; 

g) Ubertragung der aus den Massenspektren erhaltenen 
Peakmuster in Methylierungsmuster und Abgleich der 
neuert Daten mit einer Datenbank. 

■ 

35 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , 

daft man in c) ein oder mehrere amplif izierte genomi- 
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sche DNA-Fragmente durch Hybridisierung mit komple- 
mentaren Oligonukleotid- oder PNA-Sequenzen , die ko- 
valent an die Oberflache gebunden sind, immobili- 
siert . 

Verfahren nach Anspruch 2, dadurch gekennzeichnet , 
daft nach der Hybridisierung ein Cross-Linking der ge- 
nomischen DNA-Fragmente mit den an der Oberflache ge- 
bundenen Oligonukleotid- oder PNA-Sequenzen erfolgt. 

Verfahren nach Anspruch 3, dadurch gekennzeichnet, 
daft man zum Cross-Linking kovalente chemische Bindun- 
gen ausbildet. 

Verfahren nach Anspruch 3, dadurch gekennzeichnet, 
daft man zum Cross-Linking elektrostatische Wechsel- 
wirkungen ausbildet. 

Verfahren nach einem der Anspruche 3 bis 5, dadurch 
gekennzeichnet, daft die an die Oberflache gebundenen 
Oligonukleotid- oder PNA-Sequenzen 5-Bromuracil- 
Bausteine enthalten. 

Verfahren nach mindestens einem der voranstehenden 
Anspruche, dadurch gekennzeichnet, daft die immobli- 
sierten komplementaren Oligonukleotidsequenzen modi- 
fizierte Basen, Ribose oder Ruckgrateinheiten bein- 
halten. 

Verfahren nach einem der voranstehenden Anspruche, 
dadurch gekennzeichnet, daft man in b) die genomische 
DNA^Probe in Form mehrerer amplif izierter Fragmente 
vermehrt, so daft man mindestens 0,01 % des gesamten 

■ 

Genoms amplif iziert . 



20 

Verfahren nach mindestens einem der voranstehenden 
Anspriiche, dadurch gekennzeichnet , daB man die Mi- 
schung amplif izierter DNA-Fragmente auf eine Oberfla 
che bindet, auf der eine Vielzahl von unterschiedli- 
chen Punkten angeordnet ist die jeweils in der Lage 
sind, unterschiedliche Teile der amplif izierten DNA- 
. Probe zu binden. 

Verfahren nach einem der voranstehenden Anspriiche, 
dadurch gekennzeichnet, daB man in d) einen Satz von 
Sonden verwendet, welcher die Dinukleotid-Sequenz 5' 
CpG-3' nur einmal je Sonde enthalt und die Sonden an 
sonsten jeweils entweder keine Cytosin oder keine 
Guanin Basen enthalten. 

Verfahren nach einem der voranstehenden Anspriiche, 
dadurch gekennzeichnet, daB man Schritt a) eine Bi- 
sulfit- oder Pyrosulfit- oder Disulf itlosung oder ei 
ne Mischung aus den angegebenen Losungen, zusammen 
mit anderen Reagenzien fur die spezifische oder hin- 
reichend selektive Umwandlung von Cytosin in Uracil 
verwendet . 

Verfahren nach einem der voranstehenden Anspriiche, 
dadurch gekennzeichnet, daB die zur Immobilisierung 
von amplif izierter Proben-DNA verwendete Oberflache 
zugleich der Probentrager fur ein Massenspektrometer 
ist . 

Verfahren nach mindestens einem der Anspriiche 1 bis 
11, dadurch gekennzeichnet, daB man die zur Immobili 
sierung von amplif izierter Proben-DNA verwendete 
Oberflache als ganzes vor f) auf einen Probentrager 
fur ein Massenspektrometer aufbringt. 
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14. Verfahren nach einem der Anspruche 1 bis 13, dadurch 
gekennzeichnet, daft man die hybridisierten Sonden vor 
dem, nach dem oder durch den Kontakt mit einer Matrix 
von den immobilisierten amplif izierten DNA-Proben ab- 
lost . 

15. Verfahren nach einem der voranstehenden Anspruche, 
dadurch gekennzeichnet, daft die Sonden Nukleinsauren 
sind, die ein oder mehrere Massen-Tags tragen. 

16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, 
daft ein oder mehrere Massen-Tags zugleich Ladungs- 
Tags sind. 

17. Verfahren nach Anspruch 15, dadurch gekennzeichnet, ' 
daft die Sonden zusatzlich ein Ladungs-Tag tragen. 

18. Verfahren nach einem der voranstehenden Anspruche, 
dadurch gekennzeichnet, daft die Sonden modifizierte 
Nukleinsauremolekule sind. 

* 

19. Verfahren nach Anspruch 20, dadurch gekennzeichnet, 
daft die modif izierten Nukleinsauremolekule PNAs, al- 
kylierte Phosphorothioatnukleinsauren oder Alkylphos- 
phonatnukleinsauren sind. 

20. Verfahren nach einem der voranstehenden Anspruche, 
dadurch gekennzeichnet, daft man die Sonden durch kom- 
binatorische Synthese herstellt. 

21. Verfahren nach Anspruch 20, dadurch gekennzeichnet, 
daft man unterschiedliche Basenbausteine derart mar- 
kiert, daft die aus ihnen synthetisierten Sonden je- 
weils uber ihre Massen im Massenspektrometer unter- 
scheidbar sind. 
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22. Verfahren nach einem der voranstehenden Anspriiche, 
dadurch gekennzeichnet , daft man die Sonden als Teil- 
bibliotheken herstellt und diese mit unterschiedli- 
chen Massen- und/oder Ladungs-Tags versieht. 

23. Verfahren nach einem der voranstehenden Anspriiche, 
dadurch gekennzeichnet , daft man in f) matrix- 
assistierte Laser Desorptions/Ionisations Massenspek- 
trometrie (MALDI) ausfuhrt. 

24. Kit fur die Durchfuhrung des Verfahrens nach Anspruch 
1, umfassend einen Probentrager fur ein- Massenspek- 
trometer, welcher derart modifiziert ist, daft belie- 
big wahlbare Teile eines Genoms an diesen immobili- 

• siert werden und/oder Sondenbibliotheken, mit denen 
man die an den Probentrager immobilisierte DNA mas- 
senspektrometrisch analysiert und/oder weiteren Che- 
mikalien, Losungsmitteln und/oder Hilf sstof f en sowie 
gegebenenfalls einer Bedienungsanleitung . 



